1
Definir Relaciones a Través de Distribuciones Condicionales
MATH003Lesson 10
00:00
Bienvenido a un cambio de paradigma en estadística. Estamos avanzando más allá de la intuición simple de "líneas de tendencia" hacia un marco riguroso Marco de Distribución. Aquí, definimos una relación no solo por un coeficiente de correlación, sino como cualquier cambio en el comportamiento probabilístico de una variable respuesta $Y$ cuando se varía la variable predictora $X$.

Definición 10.1.1: El Vínculo Estadístico

Dos variables $X$ y $Y$ se consideran relacionadas si hay cualquier cambio en la distribución condicional de $Y$, dado $X = x$, al cambiar $x$. Por el contrario, un estado de "sin relación" es matemáticamente equivalente a la independencia de $X$ y $Y$.

Equivalencia Lógica

Las variables $X$ y $Y$ son independientes si y solo si $f(y|x) = f(y)$ para todos los valores de $x$. Esto implica que la función de frecuencia relativa conjunta puede factorizarse como:

$$f(x, y) = f(x)f(y)$$

Por lo tanto, probar una relación es fundamentalmente una prueba de Independencia.

Mecanismos de Cambio

Una relación se identifica por cualquier cambio en la función de densidad condicional (como se muestra en la Figura 10.1.1). Esto incluye:

  • Desplazamiento de la Media: El valor esperado $E(Y|X)$ cambia (el enfoque más común).
  • Desplazamiento de la Varianza: La dispersión o incertidumbre de $Y$ depende de $X$ (heterocedasticidad).
  • Cambio de Forma: La distribución general se transforma (por ejemplo, de simétrica a sesgada).

Establecer Causalidad a través del Diseño

Una relación estadística no implica causalidad. Para afirmar que $X causa $Y$, debemos tener en cuenta las variables de confusión mediante el Diseño de Experimentos:

  • Tratamientos de Control: Proporciona una base de comparación.
  • Efecto Placebo: Mitigación de la mejora percibida mediante tratamientos inactivos.
  • Cegamiento: Usando experimentos ciegos (los receptores desconciertos) y experimentos doble ciegos (receptores y investigadores desconciertos) para eliminar sesgos.
  • Bloqueo: Como se observa en Ejemplo 10.1.7, usamos variables de bloqueo ($W$, como la fertilidad del suelo) para asegurar que la relación entre el tipo de trigo ($X$) y el rendimiento ($Y$) no esté confundida por condiciones previas.
🎯 Estimación Matemática Fundamental
Estimamos estos vínculos usando Verosimilitud Condicional funciones. Para datos discretos con conteos $f_{ij}$:
$$L = \prod_{i=1}^a \prod_{j=1}^b (\theta_{j|X=i})^{f_{ij}}$$ Error Estándar: $SE = \sqrt{\frac{\hat{\theta}_{ij}(1 - \hat{\theta}_{ij})}{n}}$